超越传统3D生成:OccScene实现感知与生成的跨任务共赢
在自动驾驶、机器人导航等领域,3D场景的感知与生成一直是研究热点。然而,传统方法通常将这两个过程分离:生成模型仅仅作为数据增强工具,为下游感知任务提供合成数据。这种方法不仅灵活性有限,生成的场景也往往缺乏对感知任务有价值的细节。
在自动驾驶、机器人导航等领域,3D场景的感知与生成一直是研究热点。然而,传统方法通常将这两个过程分离:生成模型仅仅作为数据增强工具,为下游感知任务提供合成数据。这种方法不仅灵活性有限,生成的场景也往往缺乏对感知任务有价值的细节。
近年来,单步扩散模型因其出色的生成性能和极高的推理效率,在图像生成、文本到视频、图像编辑等领域大放异彩。目前主流的训练方法是通过知识蒸馏,最小化学生模型与教师扩散模型之间的分布差异。然而,现有的方法主要集中在两条平行的理论技术路线上:
近年来,单步扩散模型因其出色的生成性能和极高的推理效率,在图像生成、文本到视频、图像编辑等领域大放异彩。目前主流的训练方法是通过知识蒸馏,最小化学生模型与教师扩散模型之间的分布差异。然而,现有的方法主要集中在两条平行的理论技术路线上:
neurips fid 单步 imagenet单步 imag 2025-10-28 14:29 3
世界模型本质就是一种视频生成技术,当然它也可以用模拟器仿真测试。世界模型可以生成长尾训练视频,也可以直接用于自动驾驶。目前90%的世界模型都是用来生成训练视频的,摆脱对真实数据集的依赖。自动驾驶的生成模型必须准确地模拟多种因素,例如自车 (ego-vehicl
模型 模态 transformer fid fvd 2025-10-20 23:39 1
近期,上海AI实验室联合悉尼大学、香港中文大学和香港大学的研究团队发表了一项重要研究成果,题为《Understand Before You Generate: Self-Guided Training for Autoregressive Image Gene